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Разработка структуры данных для задачи 
поиска методом Ньютона 


Рассмотрены проблемы обобщения существующих методов поиска данных, применения динамических 
структур данных к задаче поиска, применения метода Ньютона. Показан комплексный подход к решению 
задачи поиска. Разработан метод поиска данных, основанный на применении динамических структур 
данных и разбиении массива на группы элементов. 


Введение 


В работе [1] показана связь численных методов поиска нуля функции [2-5] с 
задачей поиска индекса элемента массива по его ключу [6-8]. Было доказано, что 
метод Ньютона дает решение задачи поиска индекса, но при этом требует, чтобы 
элементы исходного массива т удовлетворяли следующим условиям: 

шй] <= [1 (1) 
шИ+ И — шй] <= ш[2] - ш +1. (2) 

Условие (1) выполняется, так как массив заведомо отсортирован по возрастанию. 
Условие (2) не выполняется в общем случае, что говорит о том, что метод Ньютона 
является достаточно узконаправленным. Метод Ньютона при выполнении условий (2) 
обладает высокой скоростью поиска — порядка 10102М. По сравнению со скоростью 
бинарного метода поиска - 102М№, данный метод обладает лучшими характеристиками, а 
в отличие от метода хорд (который обладает такой же скоростью поиска) — имеет более 
простой и быстрый алгоритм проверки условий, необходимых для применения этого 
метода. 

Методы хорд и Ньютона выполняют наименьшее количество сравнений из 
всех известных методов на сегодняшний день, но требуют выполнения опреде- 
ленных условий для взаимного расположения данных, прежде чем применять их для 
задачи поиска, поэтому данные методы необходимо развивать и обобщать. 

В данной статье предлагается динамическая структура данных, которая 
позволит применить сильные стороны алгоритма Ньютона и избавиться от 
недостатков (условие (2)), которые не позволяют применять данный метод для 
любого набора данных. 


Алгоритм поиска методом Ньютона 


Для поиска данных, удовлетворяющих условиям (1) и (2), в массиве можно 
использовать алгоритм, блок-схема которого представлена на рис. 1. 
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6126>0 && 
ш[Ы 28 ]>Кеу 


ыев = ыеВ — (мыеВ]-кеу)/(а[ыеН]-мОыев-1]) 


61е1>0 
&& 
Кеу= =п[1$1] 


Нет 


элемент 
не найден 


конец 


Рисунок 1 — Блок-схема алгоритма Ньютона 


Разработка динамической структуры данных для поиска 
методом Ньютона 


При использовании динамических структур данных, отличных от одномерных 
массивов, формулировка задачи поиска несколько изменяется, в соответствии с 
которой после поиска элемента возвращается его физический адрес в памяти (или 
ссылка на него), а не индекс (как было в случае с одномерным массивом). Таким 
образом, задача поиска элемента заключается в нахождении в организованной 
структуре данных адреса искомого элемента. Причем результатом поиска может 
служить как адрес, так и ссылка [9] на искомый элемент. В случае, если элемент не 
найден, то возвращается нулевой адрес (МОТТ.). 

Рассмотрим одномерный отсортированный массив тт с размерностью М (рис. 2). 
Данный массив удовлетворяет условию (1) и не удовлетворяет условию (2), в связи с 
чем метод Ньютона не применим. 
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п] |п[] |... ш\-И 


Рисунок 2 — Массив т размерностью М 


Выберем в группу Со из массива т возможные КОГ, элементов т[Ко], [К ||, ... 
ш[®, шк] ... и Кког.1|, где для каждого элемента выполняются условия (3): 
тн] — о <= ш[Кн2] — и[Кн}; 
Ко= 0, к = 1; (3) 
К; < Кн, 1=0, КОГ - 1. 


Рисунок 3 — Разбиение массива т на группы с формированием динамической 
структуры данных (первый шаг) 


Для полученного массива Соу выполним переиндексацию массива, начиная с 
нуля. Для данного массива можно применять поиск методом Ньютона, так как 
условия (1) и (2) выполняются. 

С оставшимися элементами, которые не вошли в массив группы Оо, 
необходимо выполнить следующие действия: 

1) сформировать группы Оло, Си, ..., Оль @шнь ..., Чтког- Элементов, которые 
не вошли в Со и находились соответственно между элементами ш[К;] и ш[К;!|. Если 
же группа не содержит элементов, то будем называть ее пустой (МОГ); 

2) переиндексировать элементы для каждой полученной группы, начиная с 
нуля; 

3) для массива каждой не пустой группы повторить действия, аналогичные 
действиям с исходным массивом т; 

4) выполнять создание структуры до тех пор, пока не получим набор групп с 
массивами, элементы которых удовлетворяли бы условиям (1) и (2). 

Таким образом, получим динамическую структуру данных, реализующую 
разбиение элементов на группы с возможностью поиска методом Ньютона в массиве 
каждой группы. Данная структура требует дополнительную память для хранения 
указателей на группы в количестве, равном размеру массива и размера каждой 
группы, что является недостатком данного метода. 

На языке программирования С++ вышеописанная динамическая структура 
данных выглядит следующим образом: 

{етр!ае <с1а5з МуТуре> 


угас М5Огоир 

{ 
МуТуре *да; //массив элементов 
М5Отоир **рМех{Отоир; //массив указателей следующих групп 
ше 17е; //количество элементов в группе 

$; 
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Поиск в динамической структуре данных осуществляется по шагам следую- 
щего алгоритма: 

1. Выбирать рабочую группу для поиска Сик, где и = 0, К =0. 

2. Выполнять поиск элемента Кеу в массиве рабочей группы методом Ньютона. 

3. В случае, если искомый элемент найден в текущей группе, то вернуть его 
адрес, иначе необходимо выполнить поиск в подгруппе, ссылка на которую 
находится между двумя элементами с индексами К и К+|, где ш[К]<Кеу и 
Кеу < ШЕИ. 

4. Если группа Си+ик пустая, то элемент не найден, иначе выбираем рабочую 
группу для поиска С.+1к и выполняем поиск элемента в массиве этой группы в 
соответствии с шагом 2. 

Полученный алгоритм поиска в динамической структуре данных полностью 
основан на методе Ньютона, в соответствии с которым скорость поиска будет 
порядка 102102М. Скорость поиска зависит от количества сформированных групп и 
от количества элементов в ней. Чем больше элементов в группе, тем меньше групп и, 
следовательно, выше скорость поиска. 


Анализ результатов тестирования метода Ньютона 
с построением динамической структуры данных 


Проведем сравнительный анализ метода Ньютона с бинарным методом, 
который на практике считается одним из наиболее быстрых. Результаты тести- 
рования методов представлены в табл. 1. 


Таблица 1 — Результаты тестирования методов Ньютона и бинарного поиска 
для данных типа _164 


Метод 
оЕЗЬ Ньютона Бинарный 
нь Кол-во Время поиска, Кол-во Время 
сравнений (мс) сравнений поиска, (мс) 
1000 11,7 _ 13,8 (+18 %) _ 
100000 15,7 55 (+72 %) 24,0 (+53 %) э2 
1000000 17,29 690 (+73 %) 28,85 (+67 %) 400 
10000000 18,68 7750 (+76 %) 34,03 (+82 %) 4406 


В соответствии с полученной статистикой можно утверждать, что полученная 
динамическая структура данных с применением метода Ньютона выполняет меньше 
сравнений на 70 — 80 %, чем бинарный поиск. Причем с ростом размера массива 
разность количества сравнений между методами растет в пользу метода Ньютона. 
По времени выполнения ситуация обратная — бинарный поиск быстрее, чем метод 
Ньютона. Это связано с тем, что метод Ньютона использует дополнительные 
вычисления — в частности, использует деление и умножение, что существенно 
снижает скорость поиска. Также негативно влияет на скорость выполнения метода 
Ньютона работа с динамической памятью, т.е. с группами элементов, в то время как 
бинарный поиск использует для хранения данных непрерывный массив. 

Стоит заметить, что операции добавления и удаления элементов из полученной 
динамической структуры данных будут эффективнее выполняться, чем в массиве, 
так как количество сдвигов элементов будет проводиться значительно меньше за 
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счет разбиения на группы. Это полезное свойство динамической структуры данных 
может быть эффективно использовано при разработке и эксплуатации баз данных 
интеллектуальных систем. 

Разработанный метод будет полезен в тех случаях, когда скорость доступа к 
элементу достаточно низкая или скорость операции сравнения элементов медленная. 
Положительным фактором метода Ньютона есть то, что он использует одно- 
направленный доступ к данным, что полезно при работе со списками. То есть вместо 
массива в группе можно использовать список для хранения данных и эффективность 
метода не будет падать. Также однонаправленный доступ полезен при работе с 
физическим носителем. 

Структура данных может использоваться для хранения упорядоченных данных 
и работы с ними. 


Выводы 


В работе рассмотрена динамическая структура данных, которая позволяет 
использовать сильные стороны алгоритма Ньютона и избавиться от недостатков, 
которые не позволяли применять данный метод для любого набора данных. 
Результаты тестирования показали, что метод Ньютона выполняет меньше операций 
сравнения относительно бинарного поиска в 1,5 — 2 раза в зависимости от количества 
элементов. Причем с увеличением количества элементов разрыв по сравнениям 
растет. Но из-за дополнительных вычислений и ресурсоемких операций деления и 
умножения его скорость на практике уступает бинарному поиску, в связи с чем 
применять метод Ньютона следует в тех случаях, когда операция сравнения 
элементов выполняется достаточно медленно, а также когда хранение данных в 
непрерывных структурах невозможно или невыгодно. Вставка и удаление в полученной 
динамической структуре данных выполняются эффективнее, чем в массиве. 

Полученную структуру данных возможно использовать для сортировки и 
хранения данных, работы с ними. Также имеет смысл построение структуры типа 
«список» на основе разработанной структуры, так как для поиска нужного элемента 
будет использоваться метод Ньютона, алгоритм которого использует однонаправ- 
ленный принцип движения, что для работы со списками очень важно. 

Скорость поиска данного метода имеет порядок [05108М. 
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И 


С.С. Синельников, В.О. Резников 

Розробка структури даних для пошуку методом Ньютона 

Розглянуто проблеми узагальнення 1снуючих методв пошуку даних, застосування динамичних структур 
даних до задач! пошуку, застосування методу Ньютона. Показано комплексний шдхд до розв’язання 
задач1 пошуку. Розроблено метод пошуку даних, заснований на застосуванн! динам1чних структур 
даних 1 розбитт! масиву на групи елементив. 


Статья поступила в редакцию 30.11.2007. 
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